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摘要 : 转录 组 是 指 组 织 或 者 细胞 在 某 一 特定 状态 下 转录 出 来 的 所 有 RNA 的 集合 。 高 通 量 第 2 代 测 序 技术 使 转录 



































理 。 本 文 简要 阐述 了 转录 组 测序 技术 的 基本 概念 














组 学 的 研究 模式 发 生 了 巨大 的 改变 ,所 衍生 出 的 转录 组 测序 迅速 成 为 研究 非 模式 生物 的 先进 技术 。 转 录 组 测序 能 
够 在 整体 水 平 上 探究 细胞 内 基因 表达 的 种 类 和 数量 ,揭示 在 特定 条 件 下 机 体 生 理 生 化 发 生 过 程 以 及 其 中 的 分 子 机 
\ 技 术 流 程 与 原理 ,详细 介绍 了 转录 组 测序 在 解决 鳞 九 目 昆 虫 的 





























分 类 FES BO 与 寄主 互 作 以 及 非 编码 RNA 调控 等 问题 上 做 出 的 贡献 ,并 对 该 技术 现存 的 困难 进行 了 系统 的 阐 








述 并 对 其 未 来 的 发 展 趋势 作出 了 简要 的 预测 与 剖析 。 
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Abstract; Transcriptome is the complete set of RNA transcripts in a specific type of cell or tissue under a 


certain stage or physiological condition. 


Next generation high-throughput sequencing technology has 


changed the study patterns of transcriptomics tremendously , from which RNA-sequencing (RNA-Seq) is 


derived. Next generation sequencing is rapidly becoming an advanced technology to explore genetic outlines 


of non-model organisms. It helps to elucidate the types and number of expressed genes comprehensively , 


which reveals the molecular mechanisms of physiological and biochemical processes in organisms under 


certain conditions. This article introduced briefly the basic concepts of transcriptome sequencing technology 


and technical processes, elaborated the contribution of this technology to solve problems about taxonomy , 


toxicology, growth and development, insect-plant interactions, and even non-coding RNA in Lepidoptera, 


and elucidated the current technical difficulties and the future trends of this technology. 
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转录 组 指 在 某 一 特定 的 生长 阶段 或 生理 条 件 
下 ,细胞 内 所 有 转录 产物 的 集合 。 它 包括 信使 RNA 
(mRNA) .核糖 体 RNA (rRNA) 转运 RNA (tRNA) 
及 非 编码 RNA。 如 果 能 够 在 最 大 程度 上 了 解 这 些 
遗传 物质 的 种 类 数量 转录 方式 以 及 剪接 模式 等 信 
息 ,并 且 定 量 地 描述 出 在 不 同 的 特定 条 件 下 这 些 信 
息 的 区 别 ,就 可 以 直观 地 将 某 物 种 基因 型 和 表 型 建 
立 联系 ,从 而 极 大 地 促进 我 们 对 细胞 内 基因 组 成 与 
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transcriptome sequencing; high-throughput sequencing; data assembly; 


功能 ( David et al., 2006; Zhang et al., 2010a) AEK 
KB (Van Belleghem et al., 2012) 、 毒 理 生 化 (Zhu et 
al., 2011) 以 及 系统 发 育 (Wang et al., 2010) 等 方面 
的 研究 。 


1 转录 组 研究 的 主要 技术 手段 


转录 组 的 研究 目前 主要 基于 两 大 类 技术 手段 : 
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分 子 杂 交 与 测序 技术 。 分 子 杂 交 属 于 高 通 量 研究 中 
相对 便宜 的 实验 手段 ,主要 利用 DNA. 碱 基 互 补 的 
原理 , 将 提前 设计 好 的 探 针 与 具有 莹 光标 记 的 
cDNA 进行 结合 ,利用 专门 的 仪器 检测 效 光 亮度 ,并 
将 其 转换 成 数字 加 以 比较 (Bertone et al., 2004; 
Cheng et al., 2005; David et al., 2006) 。 例 如 Huang 
等 (2009 ) 就 利用 家 看 Bombyx mori 的 cDNA 芯片 与 
Jg Yu PEL Ré ir rt 2 FL AF Ee] Bacillus bombyseptieus 的 家 
和 蛋 的 转录 组 杂交 ,通过 对 杂交 信和 号 的 分 析 探 究 家 香 
的 感染 后 转录 组 反应 。 然 而 分 子 杂 交 技 术 有 其 自 吴 
的 缺陷 ,例如 比较 不 同 实验 的 杂交 信和 号 结果 需要 复 
杂 的 标准 化 过 程 去 除 背 景 " 噪 音 "; 而 且 探 针 与 
cDNA 序列 之 间 可 能 发 生 假 阳 性 杂交 ,影响 实验 结 
HA ( Okoniewski and Miller, 2006; Royce et al., 
2007) 。 最 重要 的 一 点 不 足 是 ,分 子 杂 交 技 术 非 常 
依赖 现 有 的 基因 组 信息 ,因而 将 研究 对 象限 制 在 了 
那些 已 经 拥有 参考 序列 的 物种 上 面 ,而 很 多 非 模式 
物种 并 没有 基因 组 全 序列 的 信息 ,因而 无 法 通过 此 
方法 对 其 转录 组 进行 研究 ( Yang et al., 2013) 。 

不 同 于 分 子 杂 交 技 术 对 现 有 参考 序列 的 依赖 ， 
测序 技术 的 兴起 可 以 让 人 们 直接 获悉 cDNA 序列 的 
组 成 。 早 期 所 使 用 的 Sanger 测序 (Boguski et al., 
1994) 又 称 为 第 1 代 测 序 ,是 一 种 非常 实用 的 方法 ， 
但 其 通 量 低 、 价 格 高 而 且 几 乎 无 法 定量 等 弊端 使 它 
无 法 满足 更 加 精细 的 组 学 类 研究 的 要 求 。 基 因 表 达 
系列 分 析 (Velculescu et al., 1995; Harbers and 
Carninci, 2005) 可 以 通过 限制 性 酶 切 基因 组 获得 成 
千 上 万 个 表达 序列 标签 ,快速 详细 地 分 析 这 些 短 
cDNA(10 ~ 14 bp) 可 以 探寻 序列 的 表达 丰富 度 , 了 
解 特定 组 织 或 细胞 类 型 中 基因 诸多 的 表达 状态 ,可 
以 说 是 一 种 可 量化 的 高 通 量 研究 手段 ,然而 这 些 标 
签 在 进行 PCR 扩 增 和 连接 后 仍然 依赖 于 传统 的 一 
代 测 序 ,因此 费用 仍然 是 其 限制 因素 之 一 。 高 通 量 
测序 技术 (又 称 第 2 代 测 序 技术 ) 的 出 现 和 发 展 则 
突破 了 这 些 局 限 ,为 组 学 的 研究 打开 了 新 局 面 。 



































































































































2 转录 组 测序 基本 原理 


第 2 代 高 通 量 DNA 测序 技术 因为 其 单 次 运行 
(run) 产 出 序列 数据 量 大 而 得 名 ( Ansorge, 2009), 
其 获得 单个 碱 基 的 测序 费用 远 远 低 于 第 1 FOU 
近年 来 它 的 高 速 发 展 使 得 在 很 短 时 间 内 可 以 测 出 众 
多 生物 物种 的 基因 组 序列 ,为 整个 生物 学 的 研究 带 
来 了 极 大 的 突破 (Yue et al., 2012) 。 第 2 代 高 通 量 


测序 在 准确 率 、 延 长 度 和 性 价 比 三 方面 都 明显 优 于 
一 代 测 序 , 因 此 又 被 广泛 应 用 于 转录 组 的 研究 中 ,从 
而 衍生 出 转录 组 测序 (RNA sequencing, RNA-Seq) 
一 词 , 即 利 用 第 2 代 高 通 量 测序 技术 全 面 快速 地 获 
取 某 一 物种 特定 器 官 或 组 织 在 某 一 特定 状态 下 所 有 
的 转录 本 信息 (主要 包括 mRNA 和 非 编码 RNA), 
所 获得 的 海量 数据 经 过 专业 生物 信息 软件 的 比 对 、 
晶 装 等 分 析 后 ,就 可 以 还 原 出 不 同时 空 条 件 下 不 同 
晶 织 或 细胞 中 基因 表达 的 各 类 特征 (图 1)。 


3 转录 组 测序 主要 的 技术 平台 与 基本 
测序 流程 


主流 的 转录 组 测序 技术 主要 有 3 种 ,分 别 为 
2005 年 兴起 的 罗氏 454 焦 磷 酸 测序 技术 (Emrich et 
al., 2007) .2006 年 兴起 的 Tllumina/Solexa 聚合 酶 合 
成 测序 ( Morin et al., 2008) 以 及 2007 年 兴起 的 
ABIZSOLiD 连接 酶 测序 技术 ( Cloonan et al., 2008) 。 
罗氏 454 焦 磷酸 测序 法 获得 的 读 长 (reads ) 最 长 , 约 
为 600 ~ 1 000 bp ,但 其 通 量 较 低 , 单 次 运行 (run) 产 
出 数据 为 0.5 ~1 Gb;Illumina/Solexa 利用 单 分 子 簇 
的 边 合成 边 测序 技术 ,获得 的 读 长 通常 为 100 bp Ac 
右 , 但 是 其 测序 通 量 大 ,如 Hiseq2000 机 型 的 单 次 产 
出 数据 量 可 达到 600 G; ABI/SOLID 利用 DNA REIR 
获得 的 读 长 最 短 (50 bp) ,但 是 其 双 碱 基 编 码 和 克隆 
链接 校正 系统 可 以 有 效 地 降低 测序 错误 率 , 因此 
SOLiD 特别 适用 于 具有 高 质量 参考 基因 组 序列 物种 
的 重 测序 (Yue et al., 2012)。 虽 然 3 种 第 2 代 测 序 
技术 在 转录 组 的 测序 原理 数据 量 产 出 以 及 单 Run 
运行 成 本 上 均 有 不 同 之 处 (Glenn, 2011) ,但 是 基本 
的 测序 流程 比较 相似 :1) 研究 对 象 的 总 RNA 提取 ; 
2) RNA 经 过 分 离 提 纯 之 后 反 转录 成 cDNA;3) 
cDNA 片段 化 并 在 一 端 或 者 两 端 加 接头 修饰 ;4) 加 
接头 序列 大 量 扩 增 开始 并 行 测序 ,获得 序列 信息 的 
初始 读 长 (raw reads) ;5 ) 初始 读 长 的 质量 评估 , 利 
用 软件 如 RobiNA ( Lohse et al., 2012) 去 掉 低 质量 、 
短 于 设 定 阔 值 的 读 长 与 读 长 中 的 接头 序列 ,获得 干 
VRFF EI (clean reads) 进行 下 游 的 拼接 组 闭 。 
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4 转录 组 测序 数据 组 装 方法 简介 





获取 尽量 完整 的 转录 谱 是 一 切 后 续 分 析 的 基 
础 ,因此 转录 组 数据 的 拼接 质量 对 下 游 的 分 析 研 究 
至 关 重 要 。 按 照 是 否 需 要 参考 基因 组 序列 , 读 长 的 
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Fig.1 Basic pipeline of transcriptome sequencing experiments and data analyses 
拼接 分 为 两 类 。 第 一 类 为 有 参考 基因 组 信息 的 转录 。 接 广 泛 应 用 于 非 模式 物种 的 研究 中 ,成 为 了 昆虫 功 








组 数据 拼接 ,该 类 方法 的 主要 策略 是 首先 将 所 有 读 
长 比 对 到 参考 基因 上 , ERI FE iS n IR] BS] CER EC 
(overlap) 组 装 成 为 完整 的 Unigene 序列 ,并 利用 一 
些 跨 外 显 子 读 长 的 双 末端 序列 信息 判断 序列 中 的 可 
变 剪 接 位 点 。 其 代表 的 软件 有 Cufflinks ( Trapnell et 
al., 2010) ,Scripture( Guttman et al., 2010) 等。 该 方 
法 的 优势 在 于 识别 读 长 灵敏 性 强 ( Grabherr et al., 
2011) ,缺点 在 于 对 参考 基因 组 的 完整 度 要 求 很 高 。 
例如 Gan 等 (2010 ) 利用 Cufflinks 拼接 获得 了 野生 
型 和 bam R Æ W E K Rh Drosophila melanogaster 
久 梨 和 学 丸 的 转录 组 ， 并 发 现 了 突变 体 中 大 量 选择 
另外 一 类 为 无 参考 基因 的 转录 组 片段 
装 ,又 称 为 "从 头 (de movo) 组 装 ” 。 这 种 组 装 方法 
情况 下 ,首先 将 读 长 按 
HE de Bruijn 图 的 数据 结构 分 割 为 多 个 短语 ( short 
, 2001) ,并 利用 这 些 
短语 之 间 的 重 准 区 直接 进行 拼接 获得 unigene。 代 
表 软 件 为 ABySS( Birol et al., 2009) , SOAP de novo 
(Li et al., 2009) , Trinity ( Grabherr et al., 2011) 以 及 
Velvet (Collins et al. , 2008) 等 ,其 中 Trinity 在 处 理 短 
片段 的 拼接 方面 有 着 极 佳 的 表现 ( Grabherr et al., 
2011) 。 由 于 摆脱 了 对 基因 组 序列 的 依赖 ,从 头 拼 


























words 或 k-mers) ( Pevzner et al. 














能 基因 组 学 重要 的 研究 手段 之 一 。 例 如 ,Pauchet 等 
ELE SOAP de novo 拼接 法 获得 了 苏 云 金 杆 
感染 的 白杨 叶 甲 Chrysomela tremulae 中 肠 转录 
"i Zhang 55 (2013b) 利用 Trinity 拼接 获得 番茄 斑 蓉 
病毒 (TSWV ) RR Xe By yu 4b düj & Frankliniella 
occidentalis 转录 组 等 。 不 仅 如 此 , 深圳 华 大 基因 研 
究 院 主持 的 “ 千 种 昆虫 转录 组 进化 ”项目 也 是 依托 
其 先进 的 de novo 测序 拼接 平台 对 1 000 种 昆虫 的 
转录 组 进行 研究 , 旨 在 探索 昆虫 多 样 性 的 原因 及 其 
遗传 进化 机 制 ,了解 昆虫 与 生态 系统 之 间 的 相互 作 
用 ,为 生物 多 样 性 、 农 业 和 人 类 健康 等 后 续 研 究 英 定 
重要 的 基础 。 




















5 转录 组 测序 的 主要 应 用 

获得 完整 的 转录 谱 后 ,转录 组 数据 的 下 游 基 本 
分 析 一 般 集中 于 以 下 5 个 方面 : 

1) 基因 功能 注释 及 获取 新 转录 本 。 通 过 将 转 
录 本 序列 在 一 定 的 参数 下 与 nr( non-redundant , JE 7C 
余 蛋 白 数据 库 ) ~ Swiss-Prot, 京都 基因 组 百科 全 书 
(kyoto encyclopedia of genes and genome, KEGG ) 和 
蛋白 质 直 系 同 源 复 (cluster of orthologous groups of 





994 昆虫 学 报 Acta Entomologica Sinica 5735 





proteins, COG) 等 数据 库 比 对 可 获得 序列 功能 信息 ， 
同时 进行 GO( Gene Ontology ,基因 的 分 子 功 能 .生物 
学 过 程 和 细胞 组 件 ) (Ashburner et al., 2000) 或 COG 
( Tatusov et al., 2003) 等 基因 功能 分 类 统计 ,分 析 基 
因 产 物 在 细胞 中 的 代谢 途径 ( Ogata et al., 1999) ,可 
以 全 面 地 描述 生物 体 中 基因 和 基因 产物 的 属性 , 预 
测 Unigene 功能 (Ma et al., 2012) ,还 可 以 获得 低 丰 
度 转录 本 和 新 转录 本 (Zhang et al., 2010b) 。 

2) 进行 基因 转录 水 平 研究 (Robinson et al., 
2010) 。 高 通 量 转录 组 测序 可 以 高 灵敏 度 捕捉 不 同 
组 织 \ 不 同 生 理 状态 下 的 转录 组 的 表达 丰 度 ,并 用 数 
字 基 因 表 达 谱 ( digital gene expression, DGE ) 监控 其 
动态 变化 (Audic and Claverie, 1997) , 

3 ) 非 转录 RNA (non-coding RNA, ncRNA) 功能 
人 研究 ,如 微 RNA (microRNA) (Dai et al., 2011), 小 
干扰 RNA( small interfering RNA , siRNA ) (Lu et al., 
2005) 以 及 非 编码 长 RNA (long non-coding RNA, 
IncRNA) (Li et al., 2012) 等 。 对 这 些 非 编 码 RNA 
的 种 类 进行 鉴定 以 及 其 转录 水 平 的 测量 ,有 助 于 从 
表 观 遗传 学 角度 了 解 基 因 转 录 与 转录 后 的 修饰 和 调 
Tz ( Filipowicz et al., 2008) , 

4) 转 录 本 结构 变异 研究 , 即 在 整个 转录 组 范围 
内 对 基因 融合 (Maher et al., 2009) , RNA 编辑 
( Graveley et al., 2011) .选择 性 剪接 (Filichkin et al., 
2010) 等 事件 进行 鉴定 识别 ,全 面 地 了 解 转录 本 结 
构 的 变异 在 生物 体 不 同 条 件 下 发 挥 的 调控 作用 (Qi 
et al., 2011) 。 

5 ) 分 子 标记 的 开发 。 高 通 量 转录 组 测序 可 以 
为 分 子 标记 的 开发 提供 丰富 的 遗传 学 资源 , 主要 涉 
Pe AHIR ASE (single nucleotide polymorphisms, 
SNPs) FU ft E Æ (simple sequence repeats, SSRs ) 
(Schwarz et al., 2009; Zhang and Yuang, 2013) 。 
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Vera ^5 (2008 ) 发 表 的 利用 罗氏 454 测序 法 获 
AER PIE Melitaea cinxia 转录 组 的 论文 标志 着 将 
高 通 量 测序 法 引入 鳞 翅 目 物种 研究 中 已 经 可 行 。 随 
后 , 越 来 越 多 关于 转录 组 测序 在 鳞 翅 目 昆 虫 中 应 用 
的 研究 成 果 纷 纷 在 各 类 杂志 上 发 表 , 所 解决 的 科学 
问题 也 慢 慢 由 最 初 单纯 的 获得 转录 组 图 谱 、 挖 掘 重 
要 基因 (Zou et al., 2008; Vogel et al., 2011) . mi š 
向 于 解决 有 害 物种 防治 、 近 缘 种 遗传 关系 与 进化 等 
更 加 复杂 的 实际 问题 。 截 止 到 2013 年 ,已 有 包括 直 



































翅 目 、 膜 考 目 在 内 的 7 个 目的 68 种 昆虫 进行 过 转录 
组 测序 ,发表 论文 89 篇 (Zhang and Yuang, 2013), 
极 大 地 促进 了 昆虫 组 学 的 研究 。 
6.1 转录 组 测序 在 鳞 翅 目 昆虫 发 育 研 究 中 的 应 用 

鳞 却 目 昆虫 属于 全 变态 类 昆虫 ,其 摄食 和 移动 
的 能 力 在 发 育 的 不 同 阶段 差异 很 大 。 利 用 高 通 量 测 
序 研究 其 不 同 生长 阶段 的 基因 表达 与 调控 机 制 ,有 
助 于 了 解 基因 转录 图 谱 在 整个 发 育 过 程 中 的 动态 变 
化 ,为 有 害 昆 虫 的 防治 和 益 虫 保护 提供 分 子 依据 。 
例如 ,Li 等 (2013 ) 利 用 Jumina 测序 平台 ,获得 了 亚 
洲 稻 类 第 一 害虫 称 纵 卷 叶 曝 Cnaphalocrocis 
medinalis 的 转录 组 信息 ,比较 了 其 4 个 发 育 时 期 的 
转录 组 ,发 现 数 以 千 计 的 基因 表达 量 发 生 了 变化 ,其 
rp BB ER-E; 3 龄 幼虫 期 之 间 的 差异 基因 数量 最 多 而 且 
多 数 新 陈 代谢 相关 基因 在 3 龄 幼虫 中 发 生 了 上 调 ， 
因此 认为 该 生长 阶段 具有 更 强 的 代谢 活力 ;还 发 现 
在 不 同时 期 的 转录 组 中 ,有 关 虹 皮 、DNA 复制 以 及 
保 幼 激素 等 相关 基因 多 次 出 现 ,表明 其 对 发 育 的 关 
键 作 用 。Gu 等 (2013 ) 利用 相同 的 测序 手段 获得 了 
不 同 发 育 阶段 斜纹 夜 蛾 Spodoptera litura 的 转录 组 
信息 ,发 现 近 9 000 个 基因 的 表达 量 在 发 育 过 程 中 
发 生变 化 ,其 中 细胞 色素 P450 JLT JR BS ZARE 
白 酶 和 参与 性 信息 素 生 物 合成 基因 的 表达 量具 有 显 
著 改 变 。 该 研究 还 发 现 与 表皮 合成 息息相关 的 几 丁 
质 酶 .b-N- 乙 酰 氮 基 和 几 丁 质 脱 乙酰 酶 在 不 同 发 育 
时 期 表现 出 不 同 的 表达 模式 ,前 两 种 物质 在 预 晴 阶 
段 有 最 高 表达 ,但 后 者 在 肾 阶 段 表达 量 最 高 ,因此 推 
断 几 丁 质 酶 和 b-N- 乙 酰 氨基 可 能 负责 降解 幼虫 角 
质 层 的 退化 ,而 几 丁 质 脱 乙酰 酶 可 能 有 助 于 降解 肾 
的 角质 层 。 
6.2 ”转录 组 测序 在 鳞 翅 目 昆虫 与 植物 互 作 研究 中 
的 应 用 

大 多 数 鳞 翅 目 昆 虫 的 幼虫 以 植物 为 生 , 因 此 一 
些 转录 组 人 研究 专门 针对 害虫 与 寄主 之 间 相 互 作用 的 
分 子 机 制 而 展开 , 旨 在 了 解 害 虫 为 害 和 消化 寄主 的 
主要 功能 基因 以 及 害虫 对 植物 防御 毒素 的 免疫 应 答 
机 制 。 斑 娥 科 六 星 灯 蛾 Zygaena filipendulae 幼虫 可 
以 合成 生 氨 糖苷 毒素 , 主要 用 于 破坏 寄主 植物 百 脉 
TR Lotus corniculatus 细胞 壁 ,但 是 合成 该 毒素 的 相关 
基因 和 机 理 却 一 直 不 为 人 知 。Zagrobelny 55 (2009 ) 
利用 罗氏 454 测序 获得 了 六 星 灯 蛾 的 转录 组 文库 并 
将 其 与 家 看 和 黑 腹 果 蝇 的 基因 组 相 比 较 , 通 过 序列 
长 度 、GC 含量 以 及 重复 度 等 信息 确定 了 其 生 氰 糖 
昔 合 成 酶 的 相关 基因 和 代谢 通路 ,研究 推断 这 是 双 
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孔 目 蛾 类 一 种 很 原始 的 特性 ,来 源 于 与 寄主 植物 的 
趋同 进化 。Celorio-Mancera 等 (2012) 给 棉铃 虫 
Helicoverpa armigera 投 喂 不 同 的 食物 (棉花 、 烟 草 、 菜 
豆 、 磨 嘴 豆 和 两 种 人 工 食物 ) 以 及 棉花 的 不 同 组 织 ， 
并 检测 其 中 肠 基因 转录 组 表达 的 一 系列 变化 。 该 研 











染 的 舞 毒 蛾 幼虫 中 肠 细胞 转录 组 ,并 比较 了 感染 前 
和 感染 24 h 后 各 基因 的 转录 变化 。 人 研究 表明 差异 
表达 的 基因 主要 集中 于 消化 酶 类 和 结合 蛋白 类 ， 
此 推测 它们 可 能 是 Bt 毒素 攻击 害虫 最 主要 的 靶 位 
点 。 防 治 美洲 棉铃 虫 Helicoverpa zea 方法 之 一 是 喷洒 












































究 注 释 出 了 大 量 服用 不 同 食物 后 显著 变化 的 代谢 通 
路 和 消化 基因 。 研 究 发 现 该 虫 食用 大 豆 与 烟草 后 中 
肠 转录 组 反应 更 相似 , 而 食用 栅 花 花 荔 和 叶片 的 中 
肠 基因 表达 更 相似 。Fescemyer 等 (2013 ) 将 产生 蛋 
白 酶 毒素 的 转基因 玉米 喂食 秋 粘 虫 Spodoptera 
frugiperda ,并 比较 了 食用 有 毒 玉 米 和 正常 玉米 的 秋 
粘 虫 的 中 肠 转 录 组 。 研 究 发 现 受 到 毒素 伤害 的 昆虫 
其 编码 围 食 膜 组 织 和 蛋白 的 基因 出 现 了 明显 的 上 调 ， 
可 能 用 于 中 肠 围 食 膜 修复 。 同 时 , 受 毒素 伤害 的 昆 
虫 的 消化 酶 基因 家 族 ( 肽 链 内 切 酶 、 氮 基 肽 酶 .脂肪 
酶 和 淀粉 酶 ) 也 出 现 了 明显 的 上 调 , 从 而 维持 中 肠 
的 正常 的 能 量 代谢 以 补充 体能 。 
6.3 ”转录 组 测序 在 鳞 翅 目 昆虫 对 杀 虫 剂 抗 性 方面 
的 应 用 

鲜 翅 目 幼虫 的 防治 一 直 是 农林 业 保护 的 重要 课 
题 。 化 学 杀 虫 剂 用 量 少 效果 快 ,但 是 其 大 量 使 用 容 
易 使 害虫 产生 不 同 程度 的 抗 药性 。 转 录 组 测序 可 以 
筛选 出 大 量 农药 抗 性 基因 ,有 助 于 了 解 害虫 抗 药性 
发 展 和 免疫 应 答 机 理 。 例 如 He 等 (2012 ) 利用 
Illumina 测序 、Lin 等 (2013 ) 用 罗氏 454. 测序 均 获 得 
了 小 菜 蛾 Plutella xyllostella 的 转录 组 ,后 者 还 比较 
了 对 毛虫 葵 甲 酰胺 抗 性 能 力 不 同 的 小 荣 蛾 的 转录 组 
表达 量 。 两 项 研究 均 鉴 定 出 大 量 杀 虫 剂 抗 性 基因 , 
包括 细胞 色素 P450 , ACH RIPE EE AE glutathione S- 
transferase, GST) SERIA , JNR NTE EET E e 
供 方向 。 相 对 于 化 学 杀 虫 剂 而 言 ,微生物 源 的 新 型 
农药 对 人 冀 更 加 安全 ,对 环境 也 更 加 友好 ,因此 逐渐 
成 为 治理 鳞 运 目 幼虫 的 主要 方法 。 例 如 苏 云 金 杆菌 
Bacillus thuringiensis ( Bt) 是 一 种 微生物 源 低 毒 杀 虫 
剂 ,该 菌 的 主要 活性 成 分 是 一 种 或 数 种 杀 虫 晶体 蛋 
H (insecticidal crystal proteins, ICPs) , 又 称 3$- 内 毒 
素 ,对 鳞 却 目 幼虫 杀伤 力 巨大 ,然而 其 毒 理 分 子 机 制 
仍然 不 为 人 所 知 。Ma 5$ (2012) 利用 Humina 高 通 
量 测 序 获得 了 二 化 量 Chilo suppressalis 的 中 肠 细 胞 
转录 组 ,并 在 前 100 个 显著 富 集 的 基因 中 进行 筛选 
做 Western blotting 分 析 , 最 终 发 现 氨 肽 酶 的 N 和 
EH 域 能 够 与 苏 云 金 杆 菌 毒素 Cryl Ca 结合 ,揭示 了 
二 化 蜗 细 胞 中 识别 该 毒素 的 和 蛋白 区 域 。Sparks 等 






























































































































































棉铃 虫 单衣 壳 核 多 角 体 病毒 。Nguyen 等 (2012 ) 利用 
高 通 量 测序 获得 了 H. zea 的 转录 组 文库 并 构建 成 表 
达 微 阵列 芯片 。 用 该 芯片 与 被 棉铃 虫 单衣 学 核 多 角 
体 病毒 感染 的 细胞 转录 组 进行 杂交 ,比较 基因 的 表达 
水 平 在 感染 后 不 同时 长 的 变化 。 人 研究 发 现在 感染 病 
毒 后 ,其 应 激 反 应 基因 、RNA 代谢 基因 、 酶 调节 活性 
基因 和 高 尔 基体 基因 出 现 了 显著 的 表达 变化 。 研 究 
还 发 现在 感染 18 后 ,四 大 免疫 信号 代谢 通路 (Toll， 
IMD, Jak-STAT 和 JNK) 基 因 均 出 现 明显 的 表达 下 
调 ,表明 该 时 间 点 为 病毒 发 挥 毒 理 效 应 的 最 佳 时 期 。 
6.4 ”转录 组 测序 在 鳞 翅 目 分 子 标记 开发 上 的 应 用 

转录 组 测序 获得 的 大 量 基 因 片 段 极 大 地 促进 了 
DEA H EL HUES Pp CAI we I Maruca vitrata 
是 非洲 热带 地 区 的 主要 虫害 之 一 , Margam 等 
(2011) 利用 Illumina 对 其 肠 和 唾液 腺 等 组 织 进行 了 
转录 组 测序 。 在 获得 转录 组 文库 的 基础 上 ,该 研究 
筛选 出 1 542 个 SNP 位 点 ,其 中 71 个 位 点 暗示 西非 
地 区 的 M. vitrata 可 能 发 生 了 种 群 遗传 结构 分 化 。 
Pascual 等 (2012) 用 多 种 病原 微生物 侵 染 甜菜 夜 蛾 
Spodoptera exigua ,并 对 其 中 肠 、 脂 肪 体 等 不 同 组 织 
细胞 的 转录 组 进行 罗氏 454 和 传统 测序 ,获得 了 潜 
在 的 335 个 SSR 位 点 和 17 178 个 SNP 位 点 。 
O’ Neil 4: (2010) 同样 利用 罗氏 454 测序 法 得 到 和 弄 珠 
WE Erynnis propertius 和 泽 丽 风 蝶 Papilio zelicaon 两 者 
的 转录 组 ,并 分 别 检测 到 约 3.6 万 个 和 6.2 万 个 洪 
在 的 SNP 位 点 。 这 些 分 子 标记 的 开发 为 生物 遗传 
多 样 性 基因 图 谱 绘 制 以 及 环境 保护 等 研究 提供 了 
巨大 地 帮助 。 
6.5 ”转录 组 测序 在 鳞 翅 目 昆虫 分 类 与 进化 方面 的 
应 用 

单 基因 数据 信息 量 不 足 ,很 难 重 现 复 杂 的 生物 
进化 历史 ,因此 就 单纯 从 数据 量 上 来 说 ,利用 转录 组 
测序 获得 多 个 基因 片段 可 以 消除 这 种 随机 误差 
(Zou and Ge, 2008) ,更 加 可 靠 地 推断 系统 发 育 关 
系 ,为 了 解 鳞 翅 目的 成 种 机 制 与 进化 历程 提供 帮助 。 
物种 间 杂 交 的 成 种 事件 在 动物 界 中 十 分 少见 ,但 是 
JRE Papilio appalachiensis 却 有 可 能 是 P. glaucus 和 
P. canadensis 两 者 的 后 代 。 为 了 明确 这 三 者 之 间 的 



























































(2013) 用 同样 的 测序 平台 获得 了 被 苏 云 金 杆菌 感 





亲缘 关系 ,Zhang 等 (2013a) 利用 Humina 测序 获得 
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了 以 上 三 者 和 外 群 已 polytes 的 转录 组 文库 ,筛选 出 
来 四 大 类 作为 适应 性 进化 的 基因 片段 ,并 且 使 用 系 
统 发 育 和 种 群 遗 传 方法 ,探究 三 者 基因 渗入 与 基 
镰 谍 的 模式 。 结 果 表 明 三 者 并 没有 明显 的 遗传 分 
化 ,但 是 P. appalachiensis 在 染色 体 基 因 上 与 SP. 
glaucus 更 加 相似 , 而 在 Z 染色 体 基 因 上 又 与 P. 
canadensis 更 加 相似 , 因此 倾向 于 认为 该 种 为 杂交 
种 。Ferguson 等 (2010) 利 用 罗氏 454 测序 技术 获得 
了 不 同 起 型 模式 的 釉 峡 蝶 的 转录 组 ,发 现 28 个 位 于 
常 染 色 体 HmYb/Sb 区 域 的 等 位 基因 可 能 与 釉 峡 蝶 
翅 型 模式 的 决定 机 制 相关 ,并 且 发 现 其 中 6 个 基因 
出 现 过 可 变 剪 接 事 件 。 研 究 认 为 HmYb/Sb 区 域 有 
可 能 是 该 蝴蝶 翅膀 发 育 和 分 化 的 热点 区 域 ,因此 对 
研究 蝴蝶 翅膀 的 拟态 模式 、 鳞 翅 目 适应 辐射 和 趋同 
进化 有 重大 意义 。 
6.6 ”转录 组 测序 在 鳞 翅 目 昆虫 非 编码 RNA 方面 
的 应 用 

随 着 鳞 运 目 转 录 组 测序 研究 的 深入 ,研究 范围 
也 已 经 不 局 限 在 编码 RNA 上面 ,而 是 向 着 那些 更 短 
的 ,对 生命 体 活 动 具有 重要 调节 功能 的 非 编 码 RNA 
ER. Zhang 等 (2012 ) 通过 转录 组 测序 ,将 烟草 
FAR Manduca sexta 从 胚胎 到 成 虫 的 4 个 阶段 构建 
了 4 个 miRNA 文库 。 研 究 注 释 出 了 163 个 保守 的 
miRNA 以 及 13 个 稀有 miRNA ,还 找到 82 个 保守 的 
miRNA 前 体 出 现在 多 个 文库 中 。 研 究 表明 ,在 该 害 
虫 的 生长 发 育 过 程 中 ,多 种 miRNA 的 表达 量 发 生 了 










































































的 一 种 高 通 量 高 精度 的 方法 (Marioni et al., 2008; 
Bullard et al., 2010) 。 然 而 同 其 他 技术 一 样 ,转录 组 
测序 也 有 着 一 些 臣 待 解决 的 缺点 。 其 中 缺点 之 一 就 
是 测序 的 偏好 性 问题 ( Marioni et al., 2008) 。 测 序 
的 偏好 性 导致 了 转录 组 测序 获得 reads 的 数量 不 仅 
取决 于 基因 的 表达 数量 以 及 该 基因 在 基因 组 上 面 重 
复 的 次 数 ,还 取决 于 不 同 基 因 的 GC 含量 长度, 其 
至 是 基因 片段 所 在 的 位 置 , 这 种 偏好 性 使 得 不 同 基 
因 之 间或 者 不 同 细胞 之 间 的 转录 水 平 无 法 直接 进行 
有 效 的 比较 。 例 如 Risso 4 (2011) 发 现 过 高 或 者 过 
低 GC 含量 的 基因 片段 很 容易 被 忽略 ,从 而 导致 测 
序 结果 结果 过 低地 估计 了 该 类 基因 的 表达 量 。 基 因 
的 GC 含量 与 基因 功能 息息相关 , 因此 这 种 结果 会 
导致 对 基因 组 研究 的 错误 认识 。Bullard 等 (2010 ) 
指出 越 长 的 基因 被 测序 到 的 可 能 性 越 大 , 因此 会 低 
估 很 多 短 基因 的 表达 量 。Mortazavi 等 (2008 ) 在 测 
序 哺乳 动物 转录 组 的 时 候 发 现 , 位 于 转录 本 RNA 3' 
和 5 两 端的 序列 几乎 没有 被 测序 。 相 反 ， 
Nagalakshmi 等 (2008 ) 在 测序 酵母 RNA 反 转 录 得 到 
的 cDNA 时 , 却 发 现 测序 强烈 地 偏好 于 cDNA 的 片 
段 两 端的 序列 。 
7.2 数据 分 析 复 杂 的 标准 化 过 程 

测序 偏好 性 普遍 出 现 ,打破 了 当初 “比较 不 同 
组 织 不 同 细胞 的 转录 组 不 需要 复杂 的 标准 化 过 程 ” 
( Mortazavi et al., 2008; Wilhelm et al., 2008) 这 种 
过 于 乐观 的 估计 。 不 仅 如 此 ,不 同 的 测序 深度 以 及 










































































较 大 的 变化 ,因此 推断 它们 在 调控 生长 发 育 基因 表 
达 中 有 重要 的 作用 。 发 展 高 效 RNAi 介 导 的 病虫害 
防治 技术 的 第 一 步 是 要 找到 合适 的 沉默 靶 基 因 。 为 
了 筛选 这 一 世界 性 顽固 害虫 的 有 效 靶 基因 ,Li 等 
(2013 ) 通 过 Ilumina 测序 获得 了 甜菜 夜 蛾 S. exigua 
转录 组 ,并 从 中 挑选 了 9 个 候选 靶 基 因 设 计 其 特异 
siRNA ,研究 发 现 包 括 几 丁 质 酶 .血浆 谷 氮 酸 羧 肽 酶 
等 在 内 的 8 RUEDA YE TEST siRNA 后 ,其 mRNA = 
度 有 不 同 程度 的 减少 (20% ~ 94. 396 ) ,还 发 现 虫 体 
对 注射 不 同 靶 标 的 siRNA 出 现 了 发 育 迟 缓 “ 半 蚁 
皮 " 现 象 以 及 号 体 黑 化 等 不 同 的 反应 。 















































7 ”转录 组 测序 所 面临 的 困难 与 挑战 


7.1 测序 的 “偏好 性 ” 

RNA-Seq 以 测序 为 基础 ,在 整个 转录 组 的 尺度 
上 可 以 分 辨 不 同 序列 单 碱 基 的 差别 ,还 能 够 计算 不 
同样 品 不 同时 刻 表达 量 的 差别 ,是 了 解 细胞 转录 组 








转录 组 本 喘 不 同 基因 重复 数量 的 差异 ,都 会 影响 到 
数据 分 析 的 抽样 过 程 , 因 而 错误 地 估计 某 些 片段 真 
正 的 表达 量 (Robinson et al., 2010; Robinson and 
Oshlack, 2010) 。 这 样 的 情况 下 就 需要 一 个 完善 的 
标准 化 过 程 ,让 两 份 转录 样本 能 够 “公平 "地 比较 转 
录 丰 度 。 例 如 Robinson 和 Oshlack (2010) 提出 了 
caleNormFactors 函数 ,将 原始 输入 的 RNA 文库 大 小 
进行 标准 化 处 理 , 转 化 成 有 效 RNA 文库 ,从 而 有 效 
地 削减 RNA 组 成 差异 所 造成 的 表达 量 错 误 估计 。 
Risso 4 (2011) 开发 出 的 EDASeq 以 及 Hansen 等 
(2012) 开 发 的 equ 这 两 个 软件 包 , 致力 于 降低 不 同 
样本 中 GC 含量 导致 的 测序 偏好 性 和 基因 表达 量 误 
差 ,其 中 Hansen 等 (2012 ) 证 明 在 数据 标准 化 处 理 
后 ,统计 精度 提高 了 42% 。Hansen 等 (2012 ) 还 利 
用 自然 3 次 样 条 曲线 和 分 位 数 回 归 将 测序 读 长 数 效 
应 引入 到 了 泊 松 模型 中 ,从 而 调整 基因 长 度 不 同 所 
带 来 的 误差 。 这 些 复 杂 的 标准 化 过 程 的 实现 需要 生 
物 学 实验 研究 人 员 与 生物 信息 学 研究 人 员 的 通力 协 
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作 , 而 这 无 疑 增加 了 转录 组 测序 应 用 的 难度 。 
7.3 复杂 剪接 方式 增加 增加 数据 组 装 困难 
通过 转录 组 测序 获得 了 高 质量 的 reads 之 后 ， 
数据 分 析 的 首要 步骤 就 是 将 这 些 短 片段 映射 到 参考 
基因 组 上 ,或 者 是 利用 短片 段 上 的 重 闪 区 将 其 装配 
成 contig。 一 般 来 说 , 越 大 的 基因 组 ,其 复杂 度 越 
高 。 基 因 组 的 复杂 度 表 现 之 一 就 是 基因 的 反 式 剪接 
和 可 变 剪接 ,这 大 大 增加 了 信息 装配 的 难度 。 基 因 
的 反 式 剪接 (trans-splicing ) 指 的 是 两 条 不 同 的 
mRNA 的 外 显 子 连接 到 一 起 ;基因 组 的 可 变 剪 接 
( alternative splicing) 指 的 是 有 些 基 因 的 一 个 mRNA 
前 体 通 过 不 同 的 剪接 方式 (选择 不 同 的 剪接 位 点 ) 
产生 不 同 的 mRNA 剪接 异 构 体 ,是 调节 基因 表达 和 
产生 蛋白质 组 多 样 性 的 重要 机 制 。 这 些 不 同 剪接 方 
式 的 广泛 存在 使 得 在 序列 装配 的 时 候 很 难 识别 剪接 
位 点 ,从 而 进一步 增加 了 装配 的 难度 。 要 解决 这 个 
问题 需要 两 点 :一 就 是 构建 剪接 位 点 数据 库 ,将 所 有 
已 知 的 剪接 方式 以 及 潜在 的 剪接 位 点 都 包含 进去 
( Mortazavi et al., 2008; Wilhelm et al., 2008) ;第 二 
就 是 开发 新 的 计算 机 算法 ,准确 预测 新 的 拼接 方式 ， 
能 够 准确 了 解 两 条 片段 之 间 可 能 发 生 的 事件 。 而 无 
论 哪 一 种 方法 都 需要 该 物种 深厚 的 遗传 学 分 子 生 
物 学 、 细 胞 学 的 背景 知识 。 
























































8 ”小结 与 展望 


尽管 存在 着 上 述 的 困难 ,转录 组 测序 的 广泛 应 
用 仍然 给 昆虫 纲 第 二 大 目 一 一 鳞 翅 目的 研究 带 来 了 
发 展 的 契机 与 挑 成。 无论 是 辅助 开发 新 基因 位 点 ， 
定量 了 解 代谢 模式 还 是 检测 免疫 应 激 反应 等 方面 ， 
转录 组 测序 均 有 很 好 的 发 展 前 景 。 随 着 技术 的 发 
展 ,转录 组 双 末 端 测序 、 单 链 特 异性 测序 等 方法 在 测 
序 深度 和 覆盖 度 方面 都 会 有 更 大 的 突破 (Wang et 
al., 2009) 。 同 时 ,高 速 发 展 的 第 3 代 单 分 子 实时 测 
序 省 略 扩 增 步 又 ,可 以 在 短 时 间 内 测 得 大 量 低 错误 
率 读 长 片段 ,从 而 获得 更 精确 的 、 信 息 含 量 更 高 的 转 
录 组 图 谱 。 因 此 在 未 来 的 鳞 翅 目 昆 虫 研 究 中 ,可 以 
扩大 所 研究 的 昆虫 种 类 ,针对 更 多 的 非 模式 生物 K 
业 重 大 害虫 和 经 济 型 昆虫 进行 转录 组 测序 。 随 着 测 
序 技术 成 本 的 不 断 下 降 , 鳞 翅 目 昆虫 转录 组 数据 量 
必定 会 大 规模 增长 ,而 用 户 友 好 型 软件 的 开发 ,会 极 
大 地 深化 人 们 对 整个 鲜 驳 目 昆虫 转录 组 结构 和 内 容 
的 认识 ,而 这 就 方便 更 加 深刻 地 探索 它们 的 遗传 模 
式 发育 方 式 .调控 机 制 、 免 疫 应 答 机 制 . 生 态 间 互 作 


























方法 等 问题 ,从 而 解决 农林 害虫 防治 、 经 济 昆虫 保 
护 、 鳞 翅 目 昆虫 的 系统 发 育 甚至 及 其 进化 起 源 等 问 
题 。 我 们 希望 转录 组 测序 在 鳞 翅 目 昆虫 研究 方面 有 
更 加 广阔 而 光明 的 未 来 。 
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Erratum 


The first sentence of the abstract in the review article 


mediated resistance to insecticides in arthropods” 


" ATP-binding cassette transporters and their 


by QI Wei-Ping et al. on page 729, Acta Entomologica 


Sinica, 2014, 57(6) was not completely precise. As requested by authors, it should be revised as follows: 


ATP-binding cassette transporters ( ABC transporters) are a recently documented family of detoxification- 


involved proteins following cytochrome P450 monooxygenases ( P450s) , glutathione S-transferases ( GSTs) and 


carboxylesterases ( COEs). We apologize for any inconvenience caused by this revision. 


